Tổng hợp các vấn đề liên quan đến học máy (machine learning): định nghĩa, ứng dụng, các bước trong học máy, thuật toán, cách lựa chọn thuật toán.
Học máy là một lĩnh vực khoa học xây dựng các thuật toán giúp máy tính học và thực thi các hành động giống như con người (Ví dụ : chơi cờ tướng, cờ vua, nhận dạng chữ viết tay) bằng cách cung cấp cho máy tính bộ dữ liệu và thuật toán học và phân tích dữ liệu. Sau khi học xong máy tính ghi lại mô hình vừa học và sử dụng mô hình đó để thực thi các hành động đã học trên dữ liệu thực.
Học có giám sát
Là dạng học máy mà trong đó dữ liệu học có cả dữ liệu đầu vào và đầu ra mong muốn. Thuật toán được áp dụng cho học máy tạo ra một mô hình ánh xạ từ dữ liệu đầu vào (x) đến dữ liệu đầu ra (y). Mô hình gần giống như hàm số : model(x) -> y. Quá trình học sẽ kết thúc khi đạt đcược độ chính xác mong muốn của mô hình.
Học không giám sát
Là dạng học máy mà trong đó dữ liệu học chỉ có dữ liệu đầu vào. Thuật toán học được áp dụng cho học máy sẽ tự tạo dữ liệu đầu ra trên cơ sở quan sát dữ liệu học.
Học tăng cường
Là kiểu học trong học máy cho phép máy tính có thể học hành động tốt nhất từ dữ liệu học trong một điều kiện cụ thể. Trong học tăng cường bao giờ cũng có liên kết ngược để phản hồi kết quả. Một cách gọi khác của học tăng cường là học thích nghi. Thích nghi với biến đổi của môi trường giống như con người.
import numpy as npshow less
import pandas as pd
from matplotlib import pyplot as plt
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score
train = pd.read_csv("../input/random-linear-regression/train.csv")
test = pd.read_csv("../input/random-linear-regression/test.csv")
train = train.dropna()
test = test.dropna()
train.head()